函数中 CONFIDENCE 统计函数Excel

您所在的位置:网站首页 置信区间 标准偏差 函数中 CONFIDENCE 统计函数Excel

函数中 CONFIDENCE 统计函数Excel

2023-06-04 06:13| 来源: 网络整理| 查看: 265

详细信息

CONFIDENCE (alpha、sigma、n) 函数返回可用于构造总体平均值的置信区间的值。 置信区间是一系列以已知样本平均值居中的值。 假设样本中的观察值来自已知标准偏差、sigma 的正态分布,样本中的观察数为 n。

语法

CONFIDENCE(alpha,sigma,n)

参数:Alpha 是概率,0 < alpha < 1。 Sigma 是一个正数,n 是对应于样本大小的正整数。

通常,alpha 的概率较小,例如 0.05。

用法示例

假设智能商 (IQ) 遵循标准偏差为 15 的正态分布。 测试本地学校 50 名学生的 IQ,并获取样本平均值 105。 要计算总体平均值的 95% 置信区间。 95% 或 0.95 置信区间对应于 alpha = 1 – 0.95 = 0.05。

若要演示 CONFIDENCE 函数,请在工作表Excel空白,复制下表,然后在空白工作表中选择单元格 A1 Excel单元格。 在“编辑”菜单上,单击“粘贴”。

注意: 在 Excel 2007 中,单击"开始"选项卡上的"剪贴板"组的"粘贴"。

下表中的条目填充工作表中的单元格 A1:B7。

alpha

0.05

stdev

15

n

50

样本平均值

105

=CONFIDENCE (B1,B2,B3)

=NORMSINV (1 - B1/2) *B2/SQRT (B3)

将该表粘贴到新工作表Excel,单击"粘贴选项"按钮,然后单击"匹配目标格式"。

在粘贴区域仍处于选中状态后,指向"格式"菜单上的"列",然后单击"自动调整所选内容"。

注意: 在 Excel 2007 中,选中粘贴的单元格区域后,单击"开始"选项卡上的"单元格"组中"格式",然后单击"自动调整列宽"。

单元格 A6 显示 CONFIDENCE 的值。 单元格 A7 显示相同的值,因为调用 CONFIDENCE (alpha、sigma、n) 返回计算结果:

NORMSINV(1 – alpha/2) * sigma / SQRT(n)

没有直接对 CONFIDENCE 进行更改,但 NORMSINV 在 Microsoft Excel 2002 年进行了改进,然后在 Excel 2002 到 Excel 2007 之间进行了更多的改进。 因此,CONFIDENCE 可能会返回 (改进) 这些更高版本的 EXCEL,因为 CONFIDENCE 依赖于 NORMSINV。

这并不意味着应该对早期版本的 windows 365 的 CONFIDENCE 失去Excel。 NORMSINV 中的不准确通常发生在其参数值非常接近 0 或非常接近 1 时。 在实践中,alpha 通常设置为 0.05、0.01 或 0.001。 alpha 的值必须小得多,例如 0.0000001,然后 NORMSINV 中的舍入错误可能会引起注意。

注意: 有关 NORMSINV 的计算差异的讨论,请参阅 NORMSINV 一文。

有关详细信息,请单击以下文章编号,在 Microsoft 知识库中查看文章:

826772 Excel统计函数:NORMSINV

CONFIDENCE 结果的解释

2003 和 Excel Excel 2007 的 Excel 帮助文件已重写了 CONFIDENCE 的 Excel 帮助文件,因为所有早期版本的帮助文件都提供了解释结果的误导性建议。 该示例指出,"假设我们观察到,在 50 个上下班的样本中,要工作的平均行程长度为 30 分钟,总体标准偏差为 2.5。 我们 95% 确信总体平均值在间隔 30 +/- 0.692951"内,其中 0.692951 是 CONFIDENCE (0.05、2.5、50) 返回的值。

对于同一示例,该结论指出,"平均差旅时间等于 30 ± 0.692951 分钟或 29.3 到 30.7 分钟。" 可能,这也是关于概率为 0.95 的[30 – 0.692951, 30 + 0.692951] 范围内的总体平均值的声明。

在开展生成此示例数据实验之前,典型的统计家 (而不是贝叶斯统计家) 无法对总体平均值的概率分布做出任何陈述。 相反,典型的统计家处理假设测试。

例如,经典统计学家可能希望进行一个双面假设检验,该检验基于已知标准偏差 (如 2.5) 的正态分布、总体平均值的特定预先选择值 μ0 和预先选择的重要性级别 (例如 0.05) 。 检验结果将基于观察样本平均值 (例如 30) 的值,如果观察样本平均值在任一方向与 μ0 距离过远,则总体平均值为 μ0 的空假设将被拒绝。 如果拒绝 null 假设,则解释是样本平均值与 μ0 的远或远一样,在假设下可能小于 5% 的时间,而 μ0 是真正的总体平均值。 执行此测试后,典型的统计员仍然无法对总体平均值的概率分布做出任何陈述。

另一方面,贝叶斯统计人员从总体平均值 (的假设概率分布开始,名为先发分布) ,以与经典统计学家相同的方式收集实验性证据,并使用此证据来修改其总体平均值的概率分布,从而获取后向分布。 Excel没有可帮助贝叶斯统计人员完成此工作的统计函数。 Excel统计函数全部适用于经典统计员。

置信区间与假设检验相关。 鉴于实验性证据,置信区间对假设总体平均值 μ0 的值进行了简明的陈述,该陈述会接受总体平均值为 μ0 的空假设,而 μ0 值则使总体平均值为 μ0 的空假设得到拒绝。 典型的统计员无法对总体平均值在任意特定间隔内的可能性做出任何陈述,因为她或他从未对此概率分布做出先发性的假设,因此,如果使用实验性证据来修订这些假设,则这种假设是必需的。

使用本部分开头的示例探索假设测试和置信区间之间的关系。 根据上一部分所述 CONFIDENCE 与 NORMSINV 之间的关系,可以:

CONFIDENCE(0.05, 2.5, 50) = NORMSINV(1 – 0.05/2) * 2.5 / SQRT(50) = 0.692951

由于样本平均值为 30,因此置信区间为 30 +/- 0.692951。

现在,假设采用标准偏差为 2.5、样本大小为 50 和特定假设总体平均值 μ0 的正态分布,如前文所述,采用显著水平 0.05 的双面假设检验。 如果这是真正的总体平均值,则样本平均值来自正态分布,总体平均值 μ0 和标准偏差为 2.5/SQRT (50) 。 此分布是大约 μ0 的对称分布,如果 ABS (平均值 - μ0) >截止值,则想要拒绝 null 假设。 截止值是,如果 μ0 为真实总体平均值,则样本平均值的值 - 高于此截止值 μ0 或 μ0 值 – 样本平均值高于此截止值,则每个样本平均值的概率为 0.05/2。 此截止值为

NORMSINV(1 – 0.05/2) * 2.5/SQRT(50) = CONFIDENCE(0.05, 2.5, 50) = 0. 692951

因此,如果以下语句 (,则拒绝总体平均值 = μ0) 的 null 假设:

样本平均值 - μ0 > 0。 692951 0 – 样本平均值 > 0。 692951

由于示例中的示例 mean = 30,因此这两个 语句成为以下语句:

30 - μ0 > 0。 692951 μ0 – 30 > 0。 692951

重写它们以便左侧只出现 μ0 将生成以下语句:

μ0 < 30 - 0。 692951 μ0 > 30 + 0。 692951

这些正是不在置信区间 [30 – 0.692951, 30 + 0.692951] 中 μ0 的值。 因此,置信区间 [30 – 0.692951, 30 + 0.692951] 包含 μ0 的值,其中假设总体平均值为 μ0 的空假设不会被拒绝(给定样本证据)。 对于超出此间隔的 μ0 值,假设样本证据中总体平均值为 μ0 的空假设将被拒绝。

结论

在早期版本的 Excel 中,在 NORMSINV (p 和 p 中,p 的极小或非常大的值) 。 通过调用 NORMSINV (p) 来评估 CONFIDENCE,因此 NORMSINV 的准确性是 CONFIDENCE 用户的潜在关注点。 但是,在实践中使用的 p 值可能不够极端,导致 NORMSINV 中出现严重的舍入错误,并且 CONFIDENCE 的性能不应由任何版本 Excel。

本文中的大多数内容侧重于解释 CONFIDENCE 的结果。 换言之,我们曾问"置信区间的含义是什么?" 置信区间经常被误解。 遗憾的是,Excel 2003 Excel版本的所有版本的帮助文件都Excel这种误解。 改进了 Excel 2003 帮助文件。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3